Loading…
中国上海
2019 年 6 月 24–26 日
单击此处了解更多信息和注册

点击此处查看英文版日程表。
To view the English version of this schedule please go here.

我们将为所有主题演讲和分组会议提供同声传译服务。
Simultaneous translation will be provided for all keynote and breakout sessions.

场馆 + 赞助商展示区地图
Venue + Sponsor Showcase Map
Tuesday, June 25 • 17:30 - 18:05
最大限度地降低在 Kubernetes 上运行深度学习的 GPU 成本 - Kai Zhang 和 Yang Che,阿里巴巴

Sign up or log in to save this to your schedule, view media, leave feedback and see who's attending!

Feedback form is now closed.
越来越多的数据科学家在 Kubernetes 上运行基于 Nvidia GPU 的深度学习任务。与此同时,他们发现集群中的空闲 GPU 浪费了超过 40% 的成本。因此,Kubernetes 如何能帮助提高 GPU 使用效率成为一个重要挑战。
在本次演讲中,我们将介绍一款基于原生 Kubernetes 的 GPU 共享解决方案。我们将介绍所有设计和实施细节。关键主题包括,
- 如何定义 GPU 共享API
- 如何在不更改调度程序裸机代码的情况下在 Kubernetes 集群中调度 GPU 共享。
- 如何将 GPU 隔离解决方案与 Kubernetes 相集成
我们还将通过演示介绍 Tensorflow 用户如何在 Kubernetes 集群中的同一 GPU 设备上运行不同的作业。
在这款解决方案的应用期间,整体 GPU 使用得到显着改善,特别是就 AI 模型开发、调试和推理服务而言。

Speakers
avatar for Kai Zhang

Kai Zhang

Staff Engineer, Alibaba
Kai Zhang, is now a staff engineer of Alibaba Cloud. He's worked on container service product and enterprise solution development for 3 years. Before that, he worked in deep learning platform, cloud computing, distributed system and SOA area over 10 years. Recently, he is exploring... Read More →
avatar for Yang Che

Yang Che

senior engineer, Alibaba Cloud
Yang Che, is a senior engineer of Alibaba Cloud. He works in Alibaba cloud container service team, and focuses on Kubernetes and container related product development. Yang also works on building elastic machine learning platform on those technologies. He is an active contributor... Read More →


Tuesday June 25, 2019 17:30 - 18:05 CST
620